Search CORE

5 research outputs found

Mapping and Semantic Perception for Service Robotics

Author: Martinez Montiel José María
Montano Gella Luis
Riazuelo Latas Luis Miguel
Publication venue: Universidad de Zaragoza, Prensas de la Universidad
Publication date: 01/01/2018
Field of study

Para realizar una tarea, los robots deben ser capaces de ubicarse en el entorno. Si un robot no sabe dónde se encuentra, es imposible que sea capaz de desplazarse para alcanzar el objetivo de su tarea. La localización y construcción de mapas simultánea, llamado SLAM, es un problema estudiado en la literatura que ofrece una solución a este problema. El objetivo de esta tesis es desarrollar técnicas que permitan a un robot comprender el entorno mediante la incorporación de información semántica. Esta información también proporcionará una mejora en la localización y navegación de las plataformas robóticas. Además, también demostramos cómo un robot con capacidades limitadas puede construir de forma fiable y eficiente los mapas semánticos necesarios para realizar sus tareas cotidianas.El sistema de construcción de mapas presentado tiene las siguientes características: En el lado de la construcción de mapas proponemos la externalización de cálculos costosos a un servidor en nube. Además, proponemos métodos para registrar información semántica relevante con respecto a los mapas geométricos estimados. En cuanto a la reutilización de los mapas construidos, proponemos un método que combina la construcción de mapas con la navegación de un robot para explorar mejor un entorno y disponer de un mapa semántico con los objetos relevantes para una misión determinada.En primer lugar, desarrollamos un algoritmo semántico de SLAM visual que se fusiona los puntos estimados en el mapa, carentes de sentido, con objetos conocidos. Utilizamos un sistema monocular de SLAM basado en un EKF (Filtro Extendido de Kalman) centrado principalmente en la construcción de mapas geométricos compuestos únicamente por puntos o bordes; pero sin ningún significado o contenido semántico asociado. El mapa no anotado se construye utilizando sólo la información extraída de una secuencia de imágenes monoculares. La parte semántica o anotada del mapa -los objetos- se estiman utilizando la información de la secuencia de imágenes y los modelos de objetos precalculados. Como segundo paso, mejoramos el método de SLAM presentado anteriormente mediante el diseño y la implementación de un método distribuido. La optimización de mapas y el almacenamiento se realiza como un servicio en la nube, mientras que el cliente con poca necesidad de computo, se ejecuta en un equipo local ubicado en el robot y realiza el cálculo de la trayectoria de la cámara. Los ordenadores con los que está equipado el robot se liberan de la mayor parte de los cálculos y el único requisito adicional es una conexión a Internet.El siguiente paso es explotar la información semántica que somos capaces de generar para ver cómo mejorar la navegación de un robot. La contribución en esta tesis se centra en la detección 3D y en el diseño e implementación de un sistema de construcción de mapas semántico.A continuación, diseñamos e implementamos un sistema de SLAM visual capaz de funcionar con robustez en entornos poblados debido a que los robots de servicio trabajan en espacios compartidos con personas. El sistema presentado es capaz de enmascarar las zonas de imagen ocupadas por las personas, lo que aumenta la robustez, la reubicación, la precisión y la reutilización del mapa geométrico. Además, calcula la trayectoria completa de cada persona detectada con respecto al mapa global de la escena, independientemente de la ubicación de la cámara cuando la persona fue detectada.Por último, centramos nuestra investigación en aplicaciones de rescate y seguridad. Desplegamos un equipo de robots en entornos que plantean múltiples retos que implican la planificación de tareas, la planificación del movimiento, la localización y construcción de mapas, la navegación segura, la coordinación y las comunicaciones entre todos los robots. La arquitectura propuesta integra todas las funcionalidades mencionadas, asi como varios aspectos de investigación novedosos para lograr una exploración real, como son: localización basada en características semánticas-topológicas, planificación de despliegue en términos de las características semánticas aprendidas y reconocidas, y construcción de mapas.In order to perform a task, robots need to be able to locate themselves in the environment. If a robot does not know where it is, it is impossible for it to move, reach its goal and complete the task. Simultaneous Localization and Mapping, known as SLAM, is a problem extensively studied in the literature for enabling robots to locate themselves in unknown environments. The goal of this thesis is to develop and describe techniques to allow a service robot to understand the environment by incorporating semantic information. This information will also provide an improvement in the localization and navigation of robotic platforms. In addition, we also demonstrate how a simple robot can reliably and efficiently build the semantic maps needed to perform its quotidian tasks. The mapping system as built has the following features. On the map building side we propose the externalization of expensive computations to a cloud server. Additionally, we propose methods to register relevant semantic information with respect to the estimated geometrical maps. Regarding the reuse of the maps built, we propose a method that combines map building with robot navigation to better explore a room in order to obtain a semantic map with the relevant objects for a given mission. Firstly, we develop a semantic Visual SLAM algorithm that merges traditional with known objects in the estimated map. We use a monocular EKF (Extended Kalman Filter) SLAM system that has mainly been focused on producing geometric maps composed simply of points or edges but without any associated meaning or semantic content. The non-annotated map is built using only the information extracted from an image sequence. The semantic or annotated parts of the map –the objects– are estimated using the information in the image sequence and the precomputed object models. As a second step we improve the EKF SLAM presented previously by designing and implementing a visual SLAM system based on a distributed framework. The expensive map optimization and storage is allocated as a service in the Cloud, while a light camera tracking client runs on a local computer. The robot’s onboard computers are freed from most of the computation, the only extra requirement being an internet connection. The next step is to exploit the semantic information that we are able to generate to see how to improve the navigation of a robot. The contribution of this thesis is focused on 3D sensing which we use to design and implement a semantic mapping system. We then design and implement a visual SLAM system able to perform robustly in populated environments due to service robots work in environments where people are present. The system is able to mask the image regions occupied by people out of the rigid SLAM pipeline, which boosts the robustness, the relocation, the accuracy and the reusability of the geometrical map. In addition, it estimates the full trajectory of each detected person with respect to the scene global map, irrespective of the location of the moving camera at the point when the people were imaged. Finally, we focus our research on rescue and security applications. The deployment of a multirobot team in confined environments poses multiple challenges that involve task planning, motion planning, localization and mapping, safe navigation, coordination and communications among all the robots. The architecture integrates, jointly with all the above-mentioned functionalities, several novel features to achieve real exploration: localization based on semantic-topological features, deployment planning in terms of the semantic features learned and recognized, and map building.<br /

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

Repositorio Universidad de Zaragoza

Reconocimiento visual de imágenes de endoscopia con Deep Learning

Author: Murillo Arnal Ana Cristina
Riazuelo Latas Luis Miguel
Tomasini Clara
Publication venue: 'Universidad de Zaragoza'
Publication date: 01/01/2021
Field of study

La recopilación y el análisis de imágenes son una pieza fundamental dentro de los procesos de diagnóstico médico. Si bien siempre lo han sido, las aplicaciones de técnicas de Machine Learning en el ámbito de la medicina añaden agilidad y automatización a los procesos, permitiendo la diagnosis precoz. Este trabajo se centra en el procesado de imágenes de endoscopia mediante estas técnicas. Se trabaja en técnicas para la segmentación o clasificación de zonas de interés en las imágenes, por ejemplo reconstrucción 3D de la parte del cuerpo que aparece en esta imagen para detección y diagnóstico de enfermedades. En los últimos años se están proponiendo modelos de Machine Learning para el procesado de imágenes de endoscopia cada vez más precisos y eficientes, pero las imágenes de endoscopia presentan aun un reto que dificulta la generalización de los métodos de procesado: puede existir una gran variabilidad entre los imágenes debida a las condiciones particulares en las que se graban los vídeos de endoscopia. Esta variabilidad hace necesario adaptar los modelos a las imágenes particulares con las que se quiere trabajar para obtener mejores resultados.El objetivo de este trabajo es conseguir los modelos más adecuados y mejor adaptados para preprocesar las imágenes de un nuevo dataset muy amplio capturado en el marco de un proyecto Europeo. Las tareas realizadas para con- seguirlo se han agrupado en dos bloques:Se han estudiado técnicas del estado del arte supervisadas para segmentación de herramientas en imágenes de endoscopia. Además, se han estudiado técnicas eficientes en casos más generales de segmentación semántica. Se han re-entrenado los métodos existentes con datos de endoscopia reales (un dataset publicado para un challenge de segmentación de herramientas de endoscopia; otro dataset propio del proyecto en el que se desarrolla este trabajo). Se ha hecho el fine-tuning de las técnicas ya existentes para endoscopia utilizando el dataset propio del proyecto. Se ha hecho entrenado desde cero el modelo más eficiente con el dataset público, para adaptarlo a imaágenes de endoscopia y luego el fine-tuning de este mismo modelo con el dataset del proyecto. Se han evaluado todos estos modelos antes y después del re-entrenamiento (fine-tuning) con los dos datasets descritos previamente.También se han estudiado algunas técnicas no supervisadas para análisis de datos, en particular para reducir dimensionalidad y poder visualizar de manera más adecuada un resumen de conjuntos de datos muy grandes utilizando características extraídas por los modelos de segmentación previamente estudia- dos para describir estos datos. Se ha utilizado el método PCA para reducción de dimensionalidad, y el método t-SNE para análisis y visualización del contenido de vídeos de endoscopia. En particular se ha analizado la distribución de los datos en las visualizaciones obtenidas después de aplicar estos dos métodos a los descriptores de los datos.Como conclusiones principales, se puede notar primero que el re-entrenamiento hecho de los modelos ya existentes de segmentación permiten efectivamente ob- tener modelos adaptados a las imágenes del proyecto con valores de las métricas de evaluación parecidos a los del estado del arte. Se puede también notar que las visualizaciones obtenidas con las técnicas no supervisadas muestran que los descriptores extraídos por estos mismos modelos de segmentación permiten agrupar los datos según criterios sobre el contenido semántico de cada frame.<br /

Repositorio Universidad de Zaragoza

Reconocimiento y seguimiento de personas mediante un sensor RGB-d en una plataforma robótica móvil

Author: Murillo Arnal Ana Cristina
Muñoz Marzo Zilia
Riazuelo Latas Luis Miguel
Publication venue: 'Universidad de Zaragoza'
Publication date: 01/01/2016
Field of study

Este proyecto presenta un sistema de detección y seguimiento de personas desde un robot móvil. El objetivo es aplicar este tipo de sistemas en entornos públicos donde el robot busque a personas a las cuales acercarse para ofrecer algún tipo de servicio o información. Para la búsqueda de personas se ha diseñado un sistema de reconocimiento visual utilizando un sensor RGB-d. También se ha diseñado un sistema de seguimiento de esa persona seleccionada como objetivo, que consiste en acercarse a la misma. El reconocimiento se basa en las herramientas proporcionadas en las librerías de openCV. Este trabajo estudia distintas alternativas, y discute cuales se han elegido, porque y que cambios se han llevado a cabo en configuración. Después del reconocimiento de todas las personas que pueda haber en el campo de visión de nuestro robot, se debe elegir cuál de ellas se seguirá. Para ello se ha realizado un algoritmo para evaluar y ordenar las hipótesis detectadas. Por último, se seguirá a la persona seleccionada usando una plataforma robótica móvil a la que se le han proporcionado las coordenadas de la persona detectada en el punto anterior. El proceso de reconocimiento, elección y selección se repetirá hasta que el robot consigue acercarse a cierta persona, es decir, si la persona se está moviendo, el robot la seguirá. Para poder alcanzar el objetivo deseado en primer lugar ha sido necesario familiarizarse con el entorno de trabajo openCV sobre eclipse, sobre ROS, para lo cual se han usado diferentes tutoriales proporcionados por el sitio web oficial de openCV. A continuación, se han tenido que evaluar los distintos reconocedores que posee openCV y sus parámetros, para evaluar el coste y calidad de los resultados de las distintas opciones. Estos experimentos se han realizado utilizando tanto secuencias públicas utilizadas en trabajos relacionados, como datos propios capturados para realizar pruebas de seguimiento en el entorno y con el robot disponible para este proyecto. También se han realizado experimentos de integración para comprobar el funcionamiento en tiempo real de todo el sistema con la plataforma robótica móvil en distintos escenarios

Repositorio Universidad de Zaragoza

Construcción de mapas 3D densos para navegación de un robot móvil

Author: Elvira López-Echazarreta Richard
Riazuelo Latas Luis Miguel
Tardós Solano Juan Domingo
Publication venue: 'Universidad de Zaragoza'
Publication date: 01/01/2016
Field of study

Se quiere realizar la navegación y localización de un robot mediante técnicas de V-SLAM Visual Simultaneous Localization And Mapping) las cuales se fundamentan en la realización de mapas y localización del robot en el mundo mediante sensores de visión. Se van a recoger los datos que proporciona el sensor de visión y procesarlos para obtener la información que necesita el robot para conocer como es el entorno que le rodea, de forma que pueda tomar decisiones autónomas con las que llegar al destino designado previamente, evitando los obstáculos que puedan impedir el avance del robot. La información que requiere el robot es un mapa de ocupación del entorno y su posición en dicho mapa para poder planificar sus trayectorias. Para realizar esta tarea se va a utilizar un sensor RGB-D y el algoritmo desarrollado en la Universidad de Zaragoza ORBSLAM2

Repositorio Universidad de Zaragoza

Diseño, programación e integración de un robot autónomo en un festival de danza y nuevos medios

Author: Abad Liso Paula
Murillo Arnal Ana Cristina
Riazuelo Latas Luis Miguel
Publication venue: 'Universidad de Zaragoza'
Publication date: 01/01/2017
Field of study

Este trabajo presenta el resultado de la integraci ́on de un robot m ́ovil aut ́ono-mo en un espect ́aculo de danza contempor ́anea para un festival de danza y nue-vos medios. El principal objetivo es integrar en la danza un robot m ́ovil de bajocoste, con el fin de estudiar las posibilidades que este tipo de plataformas puedeofrecer a los artistas. Este proyecto se ha desarrollado en un entorno multidisci-plinar donde han colaborado personas de las ́areas de rob ́otica, dise ̃no y danza,en Etopia (centro de Arte y Tecnolog ́ıa en Zaragoza).El trabajo tiene varias fases diferenciadas, todas ellas descritas en detalleen esta memoria. En primer lugar, se acord ́o junto con el resto de equiposparticipantes la tem ́atica de la actuaci ́on.A continuaci ́on, se estudiaron los diferentes sensores y actuadores disponi-bles que se pod ́ıan a ̃nadir al robot, adem ́as de los tipos de movimientos que estepodr ́ıa realizar. Todo esto teniendo en cuenta los limites de tiempo, recursos ypreferencias y restricciones del equipo de baile. Se decidi ́o colocar en el robot unl ́aser que le permitiera localizarse en el espacio, adem ́as de unos LEDs progra-mables que le dieran personalidad y sirvieran de apoyo para las bailarinas. Elrobot se programo para realizar dos tipos de movimientos: movimientos basadosen odometr ́ıa y movimientos basados en objetivos en el mapa (es decir, dirigirsea unas coordenadas concretas del mapa).Posteriormente, los m ́odulos acordados con el equipo de danza se han idointegrando en la coreograf ́ıa. Para esta integraci ́on, dise ̃no final y programaci ́onde los movimientos y acciones del robot, todas las semanas se han realizadoreuniones o ensayos con las bailarinas o los diferentes grupos que componen elproyecto, con el fin de construir o perfeccionar la coreograf ́ıa. La coreograf ́ıa finalconsta de un conjunto demovimientosde los dos tipos mencionados, tiempos deespera relativos y tiempos de espera absolutos, adem ́as de los LEDs programa-dos para los diferentes movimiento de la coreograf ́ıa. La coreograf ́ıa programadapara el robot incluye movimientos muy precisos y que se ejecutan de maneramuy fiable y repetitiva, ya que las bailarinas ejecutan sus movimientos muycerca y muchas veces sin tener al robot en su campo de vista.La programaci ́on del robot se ha realizado utilizando ROS (Robot Opera-ting System), que se compone de un conjunto de librer ́ıas y herramientas quepermiten construir aplicaciones rob ́oticas de manera modular, y facilitan la in-tegraci ́on sencilla de sensores y actuadores.Los resultados obtenidos han cumplido perfectamente con los objetivos, sien-do incluidos en las actuaciones en directo del festival de danza contempor ́anea deZaragoza Trayectos. Esta memoria describe estos resultados finales en vivo, as ́ıcomo un an ́alisis m ́as detallado y t ́ecnico para validar m ́as formalmente los datosobtenidos del sistema (errores en trayectorias, desplazamientos y velocidades).Los principales problemas de este proyecto han sido la dificultad de coor-dinar y entenderse con equipos tan distintos y las restricciones impuestas a laprogramaci ́on y dise ̃no del robot por las necesidades de los artistas

Repositorio Universidad de Zaragoza